统计学家David Cox的故事
Editor's Note
“几年前,我们有一位访客,他是一位非常著名的决策理论导向的统计学家,他必须从提供给他的住宿条件中做出选择。有人对他说,你是决策理论方面的专家。他说:‘哦,我不会把决策理论用在像我要住在哪里这样重要的事情上!’我不认为他是在开玩笑……”
The following article is from 郭老师统计小课堂 Author 时敬贻
前记:
❝在《应用多元统计分析》课程中,我给学生们布置了一个大作业:让学生撰写一篇小短文写一写统计学家的故事。历史是由一个个鲜活的人物构成的。通过完成这样一份作业,学生能够增加对杰出统计学家的了解,感受他们对统计学的热爱,同时提升对统计学的兴趣。我会陆续发布学生们所撰写的一些文章。今天分享时敬贻同学所整理的关于David Cox的故事。
❞
统计学家David Cox的故事
写作本篇文章的时候,恰逢Sir David Cox去世,心中怅惘,想着记录一些他精彩的人生,但是网上各类新闻有关他的故事少之又少,只见人们称赞“影响深远且应用广泛的Cox比例风险模型”,但这些绝不能描绘其一生。在其漫长而杰出的职业生涯中,戴维·考克斯爵士(Sir David Cox)为统计学这门学科的发展做出了重要贡献,但正如他告诉海伦·乔伊斯(Helen Joyce)的那样,他反而是对数学物理或数学分析几乎专攻。 我本希望通过这篇文章,更全面地回顾Sir David Cox的一生,及其部分卓越的成就,但是在查找资料的过程中,发现了一本对考克斯的生平及研究成果介绍非常具体的书Celebrating statistics: Papers in honour of D.Cox 80th birthday[4],这本书记录了2004年7月14日至17日在纳沙泰尔大学(University of Neuchatel)举行的庆祝David Cox 80岁生日的会议上邀请的论文。此外还有一篇相关的文章The Accidental Statistician[5]。 这篇传记的很多内容都参考了这本书和这篇文章。
1.考克斯与统计的邂逅
David Cox于1924 年出生于英国伯明翰[3]。1942年,考克斯18岁,来到剑桥大学圣约翰学院学习数学。至于为什么会学习数学,或许不仅仅是因为喜欢。因为考克斯如是说到:“战争期间我在剑桥学数学,当时有两年的兵役豁免——有些科目是一年,而数学是两年。”于是考克斯走上了数学之路。令人意外的是,考克斯在剑桥大学的两年里,几乎没有学过统计学。“我确实上过一个短期课程,但我完全不懂,而且我一点也不感兴趣!”但政府正在寻找的却是统计学家。“在那个时候,这是一个巨大的短缺,人们错误地认为,任何在数学上相当出色的人都可以在几个月左右的时间里学会统计”,考克斯回忆道。
“两年后,一个名为联合招聘委员会(Joint Recruitment Board)的组织告诉学生们下一步该去哪里。就我而言,我被派往位于范堡罗的英国皇家航空公司(RAE)结构与机械工程系。”于是,1944年至1946年,他在范堡罗的皇家飞机制造厂工作了两年。或许是联合招聘委员会的规定,考克斯在范堡罗待了两年,直到1946年,他才可以自由地回到学校学习、研究。
然而,他没有回到剑桥,而是选择去了利兹,在羊毛工业研究协会做纺织研究。这是为什么呢?“嗯,这是一个复杂的故事。在范堡罗有一件有趣的事情让我感兴趣——关于飞机上的点焊接头——当时我在图书馆看书,偶然发现了亨利·丹尼尔斯(Henry Daniels)的一篇论文[6],他解决了我曾经解决过的同样问题。但在我做的原始笨拙的地方,他做得非常漂亮。”正是这一篇论文,改变了考克斯的人生轨迹。“当我走出图书馆时,我看到一则招聘广告,要我去和他一起工作,他的论文给我留下了深刻的印象,我立即决定申请这份工作。”这是一个冲动的决定,却有着深远的影响。“它改变了我的整个生活。否则我就会回到剑桥,从事数学物理或分析研究”,考克斯回忆道。
从1946到1950年,考克斯在羊毛工业研究协会(Wool Industries Research Association)工作了5年,并在Henry Daniels 和 Bernard Welch 的指导下于 1949 年在利兹大学获得统计学博士学位。尽管在羊毛工业研究协会的工作在本质上只是部分统计性质的,但他的职业道路现在似乎已经确定。
2.考克斯对统计的认识和坚持
那么,在考克斯几乎是偶然接触到统计学之后,他为什么决定留下来呢?“我认为统计学很大程度上是多样化的。它是理论和应用的结合,有很多不同的应用领域。”他指出,统计学研究中最有趣的地方之一是在理论和应用之间切换的可能性,以及在完全不同的应用领域之间切换的可能性,而且这种切换相对容易。他分享道,“许多人随着年龄的增长,对统计学应用的兴趣会相对超过对理论的兴趣。但我从应用开始研究,然后对理论越来越感兴趣,然后对应用越来越感兴趣,尽管我并没有把这两者分开。”
坚持理论和应用相结合是考克斯一直坚持的事,但在当时的环境下也是很困难的一件事。“纯理论学家有很大的发展空间,显然专攻应用的人也会有很好地发展前途,但统计这个学科作为一个整体需要一些理论和应用的相互作用。这是非常困难的,因为如果之前没有人这样做,就不容易想到我们应该要做什么。”考克斯回忆道,“在25或30年前,大多数最好的学生都想从事理论研究。如果这是可以应用的理论,那也很好,但应用在那个时代并不是首要的。而现在,很少有学生会说,‘我特别想攻读理论博士学位。’他们都想做医学统计、金融或其他什么,一方面是因为他们想做一些有用的事情,这完全值得钦佩;另一方面是因为他们觉得自己可以看到一条职业道路,这也是很自然的。但如果有更多的博士生说他们想继续研究一些理论,那就太好了。”
这种只倾向于理论或应用的某一方面做法,尽管在英国相对较晚,但在欧洲大陆早已较为普遍。所有的学科都是国际化的,统计也不例外,但在不同的国家也有不同的研究偏好。在上个世纪(20世纪),英国统计的传统一直是理论和应用相结合;而在欧洲,它要么是相对描述性的——比如在经济学或医学数据处理中——要么是非常强大的理论,但很少有中间地带。“这可能要追溯到牛顿和莱布尼茨吵架的时候。这导致了直到20世纪,英国的纯数学几乎与欧洲大陆的纯数学隔离开来。像Cayley、Sylvester等人在19世纪做了很多关于代数的研究,但在英国你找不到一个分析学家或拓扑学家。”
“但在另一方面,英国的应用数学,即古典数学物理,非常强大。于是产生了某种理论和应用的混合体,我认为这促进了传统的英国统计的诞生。或者可以说,英国有一种经验主义的传统,相比之下,比像法国或德国之类的国家更学术、更哲学的传统。”
3.考克斯的统计生涯
在对统计的认识和坚持下,他继续在统计学界发光发热。 1950年至1955年,他在剑桥大学工作,并担任数学助理讲师。
1956年,他成为伦敦伯贝克学院(Birkbeck College)的统计学讲师,并于1961年成为该学院的教授,他在这里一直任职到1966年。 1966年至1988年,他是伦敦帝国理工学院(Imperial College, London)的统计学教授,并开始担任期刊Biometrika的主编。
1988年,他成为牛津大学纳菲尔德学院的院长和统计学系的成员,并于1994年8月1日正式退休。
4.考克斯的贡献和荣誉
要说考克斯爵士最有名的理论,我前两个想到的就是Box-Cox变换和Cox比例风险模型,这两个理论都在统计学相关研究中有着非常广泛的应用。 1964年,考克斯和博克斯在皇家统计学会期刊上发表了论文An Analysis of Transformations[1],这篇论文中提出了著名的 Box-Cox变换,以提高大部分统计研究的稳健性。据说因为他们的名字十分相似,他们才决定共同撰写一篇文章,而这篇论文无疑成为了统计方法的一个重要组成部分。 1972年3月8日,星期三,在皇家统计学会研究部组织的一次会议上,考克斯宣读了这篇使他留名千古的文章Regression Models and Life-Tables[2]。在Cox比例风险模型中,考克斯提出了一种风险函数 ,该函数分为与时间相关和与时间独立的两部分。通过将依赖于时间与不依赖于时间的部分分开,医学数据的分析大大简化,这也使得Cox模型在医学研究中被广泛使用。
此外,他兴趣广泛,研究多样化,撰写了关于统计学许多方面的书籍,包括《随机过程理论》(与H.D. Miller合著,1965年)、《理论统计学》(与D.V. Hinkley合著,1974年)、《生存数据分析》(与David Oakes合著,1984年)和《统计推理原理》(2006年)。[3]
戴维·考克斯爵士的荣誉更是多得数不胜数。他曾获得众多荣誉博士学位。他是Neuchatel大学的荣誉博士,也是剑桥圣约翰学院和精算师协会的荣誉会员。他曾被授予皇家统计学会的盖伊银质(1961年)和金质(1973年)奖章(Guy medals in Silver and Gold)。1973年,他被选为伦敦皇家学会会员,1985年被英国女王伊丽莎白二世封为爵士,2000年成为英国皇家学会荣誉会员。他还是美国国家科学院的外籍院士。1990年,他获得了凯特林奖和癌症研究金奖[7]。2010 年,他因“对统计理论和应用的开创性贡献”而被授予英国皇家学会科普利奖章。他也是第一个获得国际统计奖(International Prize in Statistics)的学者(2017 年)。
早在2004年时,戴维•考克斯爵士就已撰写或与人合著了300篇论文和著作。从1966年到1991年,他是Biometrika的主编。他指导、合作和鼓励了许多学生、博士后和同事。他曾担任伯努利学会(Bernoulli Society)、皇家统计学会(Royal Statistical Society)和国际统计学会(International Statistical Institute)的主席。他还是牛津大学纳菲尔德学院的荣誉研究员和统计学系的成员。
5.考克斯的一些其他思想
考克斯是一个聪慧而睿智的人,他对于计算机的发展、对于教学、对于统计学的意义都有深入的思考和深刻的见解。
5.1 考克斯对新时代的思索
在21世纪,今天的统计学家面临着许多紧迫的问题,考克斯认为这些问题对这门学科的未来有直接的影响。“对我影响最大,而我对其影响最小的,就是计算机。”考克斯分享道,“我想它并没有改变很多科学研究原理和原则。当然,在另一方面,它确实改变了数据收集和存储,也完全改变了数据分析的策略,并促使产生了许多富有成果的新想法。”
那么考克斯会为计算机的无处不在而担心吗?“纯粹就个人而言,是的,因为我感到非常无助!”考克斯提到,“另一个让我担心的问题是,有些人谈论信息爆炸,因为他们有很多很多的数据……但这不是信息爆炸;这是一个数据爆炸,但和信息爆炸并不一定是一回事。我认为这一点可能会被忽视。”
5.2 考克斯对教学的理解
在被问到“怎么向大众说明统计学家不是简单的枯燥乏味的数字处理机器,而是有活力的、有创造力的科学家”这个问题时,考克斯的回答直截了当,平淡无奇:“做好工作,确保人们知道它,尽管去做就好。就像一场大型的广告宣传活动将会使你的生活变得更美好,不是靠福利传播,而是要悄悄地与人们合作,在不知不觉中唤醒他们的统计思维。”
考克斯补充道,这也是一个向学生介绍统计学的正确方式。“第一件事必须是确保学生在大学里学的第一门统计学课程真的很好,但这是非常困难的。教师如果只强调数学的魅力,可能会吸引一些人,但可能让其他人望而却步;同样,只强调应用程序、计算机、哲学也会如此。我个人的感觉是,教师应该考虑到整个学生群体,并为他们量身定制一些东西。但是,应该让统计学狂热爱好者来教第一堂课。这个改变是一个漫长的过程,但我认为英国有决心这样做。例如,在美国,你有时会发现一些大型的入门课程是给没有经验的老师上的,而由资深的人教授专业课程——这往往是一种错误的方式,是有害的。总的来说,应该由年轻人来教专业课程,而更有经验的人应该教第一门课程,因为如果学生在任何一种选择中开始得不好,他们可能永远不会去上第二门课程。”
5.3 考克斯对统计学价值的思考
那么,假设有天赋的统计学家能够通过第二门课程,以及随后的课程,那么一旦他们获得资格,他们应该做什么呢?“我认为对统计学家来说,最重要的是与非常优秀的科学家合作,或者更普遍地说,与任何领域的非常优秀的人合作。”对于这种工作,考克斯区分了合作和咨询,“咨询可能意味着有人进来,你说,‘你为什么不试试这个或那个?’然后他们走了,你就再也没有他们的消息了。这可能对他们很有帮助,但这和合作是非常不同的,合作是你自己对这个合作领域了解很多,这样你就可以用科学家的术语进行讨论。当然,在医学统计学中,这是一个根深蒂固的传统。”考克斯继续说道,“这是一种压力,几乎是一种道德义务,当人们陷入困境时,帮助他们走出困境。如果有人做了一个设计很差的实验,必须得到救助,有些人会把统计学家视为可以求助的资源。好吧,我们有义务提供帮助,但我怀疑大学统计学家在这方面花了太多时间,而不是去寻找最好的合作伙伴。”因此,统计学家的地位应该自然地从一开始就与其他科学家平等合作,而不是只在情况看起来糟糕的时候才被引入。这是考克斯对“如果我需要统计数据,我的实验就做错了”这种普遍存在的想法的有力回击。
如果我们要让统计学得到应有的重视,不仅那些需要统计学和需要统计学家帮助的人必须了解它的价值,统计学家自己也必须了解它的价值。考克斯举了个例子:“几年前,我们有一位访客,他是一位非常著名的决策理论导向的统计学家,他必须从提供给他的住宿条件中做出选择。有人对他说,你是决策理论方面的专家。他说:‘哦,我不会把决策理论用在像我要住在哪里这样重要的事情上!’我不认为他是在开玩笑……”
参考资料
Cox的其中两篇重要论文
[1] Box, G. E. P ; Cox, D. R, “An Analysis of Transformations”, Journal of the Royal Statistical Society. Series B, Methodological, 1964-01-01, Vol.26 (2), p.211-252
[2] Cox, D.R. (1972). “Regression models and life-tables”, Journal of the Royal Statistical Society: Series B(Statistical Methodology), 34, 187-202.
其他参考资料
[3] https://www.britannica.com/biography/David-Cox-British-statistician
[4] Anthony C. Davison, Yadolah Dodge, Nanny Wermuth, Celebrating statistics: Pa-pers in honour of D.Cox 80th birthday
[5] David Cox (2004). “The Accidental Statistician”, Significance
[6] Daniels, H. E. (1945) “The statistical theory of the strength of bundles of threads”, Proceedings of the Royal Society, A, 183, 405–435.
[7] (1990) Sir David R. Cox Wins Kettering Prize, CHANCE, 3:3, 37, DOI: 10.1080/09332480.1990.10554968